Caractérisation automatique des classes découvertes en classification non supervisée
نویسندگان
چکیده
Résumé. Dans cet article, nous proposons une nouvelle approche de classification et de pondération des variables durant un processus d’apprentissage non supervisé. Cette approche est basée sur le modèle des cartes auto-organisatrices. L’apprentissage de ces cartes topologiques est combiné à un mécanisme d’estimation de pertinences des différentes variables sous forme de poids d’influence sur la qualité de la classification. Nous proposons deux types de pondérations adaptatives : une pondération des observations et une pondération des distances entre observations. L’apprentissage simultané des pondérations et des prototypes utilisés pour la partition des observations permet d’obtenir une classification optimisée des données. Un test statistique est ensuite utilisé sur ces pondérations pour élaguer les variables non pertinentes. Ce processus de sélection de variables permet enfin, grâce à la localité des pondérations, d’exhiber un sous ensemble de variables propre à chaque groupe (cluster) offrant ainsi sa caractérisation. L’approche proposée a été validé sur plusieurs bases de données et les résultats expérimentaux ont montré des performances très prometteuses.
منابع مشابه
New Word Vector Representation for Semantic Clustering
RÉSUMÉ. L’idée que nous défendons dans cet article est qu’il est possible d’obtenir des concepts sémantiques significatifs par des méthodes de classification automatique. Pour ce faire, nous commençons par proposer des mesures permettant de quantifier les relations sémantiques entre mots. Ensuite, nous utilisons les méthodes de classification non supervisée pour construire les concepts d’une ma...
متن کاملPanorama de quelques approches récentes pour la classification non supervisée de graphes
Résumé. Les avancées technologiques récentes ont permis d’acquérir dans de nombreux domaines des corpus de graphes. Une problématique en plein essor consiste à classer ces données complexes pour établir des typologies. Différentes approches développées en fouille de données sont présentées dans cet article: la visualisation de graphes dans une perspective exploratoire, la caractérisation des gr...
متن کاملLa morphologie mathématique binaire pour l'extraction automatique des bâtiments dans les images THRS
RÉSUMÉ. Cet article présente une nouvelle méthode de détection et d’extraction des bâtiments en milieu urbain à partir d’images satellitaires à très haute résolution spatiale. L’approche proposée est fondée sur l’application et l’enchainement automatique d’opérateurs issus de la morphologie mathématique binaire. Plusieurs étapes constituent la méthode : (1) binarisation de l’image, (2) filtrage...
متن کاملClassification Automatique Non supervisée de Documents Textuels basés sur Wordnet
Mettre en œuvre l’une des méthodes de classification non supervisée consiste en premier lieu à choisir une manière de représenter les documents (Sebastiani, 2002) ; dans un second temps il faut choisir une mesure de similarité, et en dernier lieu choisir un algorithme de classification que l'on va mettre au point à partir des descripteurs et de la métrique choisis. Tout document dj sera transfo...
متن کاملUne nouvelle approche pour la classification non supervisée en segmentation d'image
Résumé. La segmentation des images en régions est un problème crucial pour l’analyse et la compréhension des images. Parmi les approches existantes pour résoudre ce problème, la classification non supervisée est fréquemment employée lors d’une première étape pour réaliser un partitionnement de l’espace des intensités des pixels (qu’il s’agisse de niveaux de gris, de couleurs ou de réponses spec...
متن کامل